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Abstract (Basic): EP 875567 A 

A protein (SEQ 2) (a defined sequence of 803 amino acids given in 
the specification) is new. 

USE - The organisms can be used to produce the protein (a 
Myc-binding zinc finger protein). The protein can be used to identify 
transcription-modulating substances, in a process comprising: (a) 
incubating the protein with myc gene product under conditions such that 
a complex is formed between the two proteins; (b) repeating (a) in the 
presence of one or more test substances; (c) determining the difference 
in protein complex formation between (a) and (b); and (d) selecting 
substances for which the protein complex formation in (b) is different 
from that of (a). The protein can be used to produce antibodies. The 
nucleic acid sequence can be used for gene therapy. The nucleic acid 
sequence complementary to the above sequence is useful for gene therapy 
(claimed). 
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Beschreibung 

Die voiiiegend Erf indung betrrfft Myc-bindende Zinkfinger-Proteine, ihre Herstellung und ihre V rwendung. 

Myc ist ein spezrf isch an DNA bindendes Protein. Es wird zur Familie der Helix-Loop-Helix/Leucin-Zipper (HLH/LZ) 
5 Transkriptionsfakloren gezahlt (Landschulz et al. 1988, Murre et aL, 1989). Myc ist ein zentraler Transkriptionsaktivator, 
der mitdem Protein Max (Amati et al., 1993) einen Komplex bildet unddurch diesen molekularen Mechanismus andere 
Gene aktiviert. beispielsweise alpha-Prothymosingen, Ornithindecarboxylasegen und cdc25A. 

Von Schulz et al. 1 995, wurde ein 1 3 Zinkf inger enthaltendes Protein aus der Maus beschrieben, dessen zelluiare 
Funktion jedoch unWar ist 

w Aufgrund seiner Schlusselstellung in der Transkription bietet Myc einen Ansatzpunkt zum Verstandnis von zelluia- 
ren, insbesondere von pathophysiologischen Prozessen. 

Es bestand daher die Aufgabe, wertere Informationen uber die molekulare Wirkungsweise von Myc, insbesondere 
Qber die Myc vermrttelte Genrepression bereitzustellen. 

Gegenstand der Erfindung ist ein Protein mit der in SEQ ID NO:2 dargestellten Aminosauresequenz. Dieses Pro- 
15 tein besitzt dreizehn Zinkf ingerdomanen. — I 
Es weist folgende bioiogischen Eigenschaften auf : £D 

• Spez'rfische Bindung an Myc. C~> ^ m 

• Transaktivierung des Adenovirus Major Late (AdML) Promotors, DP 

20 • Transaktivierung des Cyclin D1 Promotors. pH ^ >-j 

• durch Assoziation mit Myc wird die Transaktivierung gehemmt. ^ ^ jTj 

in Abwesenheit von Myc ist das Protein im wesentlichen im Cytosol assoziiert mit Mikrotubuli zu finden. ^ § m 

Ein weiterer Gegenstand der Erfindung sind Proteine, die sich aus der SEQ ID NO:2 dargestellten Struktur|gch rs> JM 
25 Substitution, Insertion Oder Deletion von einem oder mehreren Aminosauren ableiten lassen, wobei diese P^ne 
noch die wesentlichen bioiogischen Eigenschaften des durch SEQ iu NO:2 beschriebsnen Proteins besitzen.^se 
Proteine werden im folgenden Muteine genannt. Unter wesentlichen Eigenschaften wird die spezifische Bindung der 

Muteine an Mvc verstanden. 

Die oben aufgefuhrten Eigenschaften des durch SECrtP"NO:2-besdTi^^ bei den 

30 Muteinen vorhanden sein, solange die spez'rfische Bindung an Myc gegeben ist. Bevorzugt sind jedoch diejenigen Mut- 
eine, die alle der oben aufgefuhrten Eigenschaften besitzen. 

Die Anzahl der durch Insertion Substitution oder Deletion gegenuber dem durch SEQ ID NO:2 beschriebenen Pro- 
tein verSnderten Aminosauren kann zwischen 1 und 100, bevorzugt zwischen 1 und 50 Aminosauren variieren. Die Ver- 
anderungen k6nnen in einem Weineren Bereich des Molekuls konzentriert oder auch uber das ganze MolekOI verteilt 
35 sein, 

Bevorzugte Veranderungen sind konservative Substitutionen, bei denen eine Aminosaure durch eine andere Ami- 
nosaure mit ahnlicher RaumerfOllung. Ladung oder Hydrophilie ersetzt wird. 
Beispiele fflr solche konservativen Substitutionen sind 

40 Ersatz von Arg durch Lys oder umgekehrt. 

Ersatz von Arg durch His oder umgekehrt, 

Ersatz von Asp durch Glu oder umgekehrt, 

Ersatz von Asn durch Gin oder umgekehrt 

Ersatz von Cys durch Met Oder umgekehrt 
45 Ersatz von Cys durch Ser oder umgekehrt, 

Ersatz von Gly durch Ala oder umgekehrt, 

Ersatz von Val durch Leu oder umgekehrt, 

Ersatz von Val durch lie oder umgekehrt. 

Ersatz von Leu durch He oder umgekehrt, 
so Ersatz von Phe durch Tyr oder umgekehrt. 

Ersatz von Phe durch Trp oder umgekehrt. 

Ersatz von Ser durch Thr oder umgekehrt. 

Die Veranderungen kOnnen auch kombiniert werden, z.B. eine Oder mehrere Substitutionen mit Deletionen 
55 und/oder Insertionen. 

Ein weiterer Gegenstand der Erfindung sind NuWeinsauresequenzen, die fOr die oben beschriebenen Proteine 
codieren. Solche NuWeinsauresequenzen sind bevorzugt DNA. insbesondere cDNA Sequenzen, in einz Istrangig r 
oder doppelstrangiger Form. 
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Bevorzugte Nukl insSuresequenzen sind soiche mit der in SEQ ID NO:1 dargestellt n Sequenz und solche, die mit 
dieser Sequenz einen hohen Verwandschaftsgrad aufweisen, beispielsw ise solche, die fur das gleiche Protein codie- 
ren wie SEQ ID NO:1. Weitere bevorzugte NuWeinsauresequenzen sind solche. die fur ein Protein codieren, das 95% 
Oder mehr Identrtdt mit dem Protein der Sequenz SEQ ID NO:2 aufweist. 

5 Ein weiterer Gegenstand der Erfindung sind Vektoren, die eine der oben beschriebenen NuWeinsauresequenzen 
in funktioneller Verknupfung mit einem Oder mehreren Regulationselementen tragen. Unter Regulationselemente sind 
NuWeinsaurefragmente zu verstehen, die auf Transkription oder Translation einen regulierenden EinfluB haben, bei- 
spielsweise Promotoren, Enhancer, Polyadenylierungsstellen, ribosomale Bindungsstellen. 

Die mit solchen Vektoren transformierten Wirtsorganismen sind ebenfalls Gegenstand der Erfindung. Als Wirtsor- 

10 ganismen geeignet sind Mikroorganismen, pf lanzliche oder tierische Zellen Oder Lebewesen. Bevorzugte Wirtsorganis- 
men sind eukaryontische Zellen und Lebewesen. Der Begriff Wirtsorganismus umfaBt auch beispielsweise transgene 
Tiere und Pflanzen. 

Die Herstellung der erfindungsgemaBen Proteine erfolgt bevorzugt mit Hilfe gentechnischer Verfahren. Ein Wirts- 
organismus, der die Erbinformation fOr die erfindungsgemaBen Proteine tragt, wird unter Bedingungen kultiviert, die die 
15 Expression des Proteins erlauben. Diese Bedingungen -wie Temperatur, Nahrmedium, Zelldichte - hangen weitgehend 
von der Wahl des Wirtsorganismus ab. Solche Bedingungen sind jedoch dem Fachmann fur die einzelnen Wirtsorga- 
nismen geiaufig. 

Die exprimierten Proteine werden anschlieBend, ggf. nach Aufbrechen des Wirtsorganismus, vom Wirtsorganis- 
mus abgetrennt und in reiner Form durch bekannte Methoden der Proteinreinigung, wie Failung, Chromatographie. 
20 Elektrophorese in reiner Form isoliert Ein weiterer Gegenstand der Erfindung ist die Verwendung der Proteine als Anti- 
gen zur Herstellung von AntikoYpern, sowie die so erhaltenen Antikdrper. Es lassen sich durch dem Fachmann 
bekannte Verfahren polyWonale Antiseren oder auch monoWonale AntikOrper herstellen. 

Die erfindungsgemaBen Proteine eignen sich auch als Testsysteme zur Auffindung von potentiellen selektiven 
Transkriptionsmodulierenden Substanzen. Dies laBt sich besonders gut testen, indem man die Fahigkeit der Proteine, 
25 mit Myc einen Proteinkomplex zu bilden, ausnutzt. Ein weiterer Gegenstand der Erfindung ist daher ein Verfahren zur 
Identifizierung von spezH ischen transkriptionsmodulierenden Substanzen, das foigende Schritte urnfaBt: 

(a)-lnkubati on des Proteins gemaB Anspruch 1 mit dem Ge nprodukt von myc unter Bedingungen, unter denen sich 

ein Proteinkomplex zwischen diesen beiden Proteinen ausoildet; 

(b) Inkubation der beiden Proteine unter ansonst gleichen Bedingungen wie (a) jedoch in Anwesenheit einer oder 
mehrerer Substanzen, die auf spezif ische transkriptionsmodulierende Aktivitaten zu testen sind, 

(c) Ermitteln des Unterschiedes in der Proteinkomplexbildung zwischen (b) und (a), 

(d) Auswahl solcher Substanzen, bei denen gemaB Schritt (b) eine andere Proteinkomplexbildung erhalten wurde 
alsbeiSchritt(a). 

Es lassen sich damit Substanzen auffinden, die die Proteinkomplexbildung zwischen den neuen Zinkfingerprotein 
und Myc fOrdern, aber auch solche, die sie unterbinden. 

Die erfindungsgemaBen NuWeinsauresequenzen eignen sich auch zur Gentherapie von Erkrankungen, bei denen 
die durch Myc vermittelte Transkription gesttrt ist. 

Beispielsweise konnen zusatzliche Gensequenzen eingebracht werden urn so die zelluiare Konzentration der Zink- 
f ingerproteine zu erhdhen. Es kann aber auch gewOnscht sein, daB die Konzentration der Zinkfingerproteine erniedrigt 
werden soli. In diesem Falle bietet sich eine Gentherapie auf antisense Basis an, wobei man eine zu dem Zinkfinger- 
proteingen komplementare NuWeinsaure oder NuWeinsaurederivat appliziert, und somit die Expression des Zinkfinger- 
proteingens reduziert. 

Die weitere Ausgestaltung der Erfindung ist in den folgenden Beispielen aufgefuhrt. 

Beispiel 1 

Isolierung der DNA mit der durch SEQ ID NO:1 beschriebenen Struktur 

Vorausgegangene Arbeiten hatten gezeigt, daB die Integritat der Helix-Loop-Helix Domane von Myc kritisch for die 
Genrepression durch Myc in stabilen Zellinien war (Philipp et al. f 1 994). Urn neue Proteine zu kJentif izieren, di mit dem 
C-Terminus von Myc interagieren, wurde ein DNA-Fragment, das fOr die basische Region und die HLH/LZ Domane 
(Aminosauren 355-439 des humanen Myc) codiert, im Leserahmen an di DNA birtdend Domane von GAL4 ( Amino- 
saure 1-147) fusioniert und als Koder in inem Two-Hybrid-Screen" (Fields and Song, 1989) benutzt. 
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2x1 0 5 unabhangige Transformanden einer HeLa cDNA Bibliothek, markiert mit der GAL4 Aktivierungsdomane, 
wurden gescreent. Ein Clon mit p-Galaktosidaseaktivitat wurde welter charakterisiert Es wurde keine Interaktion zwi- 
schen dem von diesem Clon codierten Protein und der DNA Bindungsdomane von GAL4 allein oder einer GAL4-BCY- 
1 Chimare, die als Negativkontrolle benutzt wurde, festgesteltt. 
5 Die Interaktion mit Myc wurde aufgehoben durch Deletion der HLH-Domane in Myc (370-412), nicht aber durch 
Insertion der vier Aminosauren zwischen der HLH DomSne und dem Leucin-Zipper (In 412) oder durch Deletion des 
gesamten Leucin-Zippers (412-434). Eine spezifische Interaktion wurde auch nachgewiesen mit N-Myc aber keine mit 
MAX oder USF, zwei HLH-Proteinen, die mit Myc nahe verwandt sind. 

cDNA-MolekOle mit voller Lange wurden durch ein S'-RACE-Protokoll isoliert und sequenziert (SEQ ID NO:1). Sie 
w codieren ein Protein mit 803 Aminosauren (SEQ ID NO:2) mit einem theoretischen Molekulargewicht von 87,970 Dal- 
ton. Das Protein wurde Miz-1 fur Myc- Interact* ng-Zincfinger-Protein-1 genannt. 

Die Sequenzierung ergab, daB der isolierte Clon fur ein Zinkfingerprotein mit 13 Zinkfingern codierte, 12 davon 
unmittelbar geclustert in der C-terminalen Halfte des Proteins. 

15 Beispiel 2 

Herstellung von Muteinen 

Ausgehend von der in SEQ ID NO:1 dargestellten Nukleinsauresequenz kOnnen mit dem Fachmann gelaufigen 
20 Methoden der Gentechnik NuWeinsauren hergestellt werden, die for veranderte Proteine (Muteine) codieren. Die Her- 
stellung der Muteine selbst erfolgt zweckmaBigerweise durch Expression einer Nukieinsaure in einem geeigneten 
Wirtsorganismus. 

Beispiel 3 

25 

Assoziation des Proteins SEQ ID NO:2 mit Myc 

Der-G-lermir4us.des-Protein s SEQ ID NO:2 (Aminosaure 269-803) wurde m it der Glutathion-Transferase (GST) 

(Smith and Johnson, 1 988) fusioniert, das GST-Miz^TFusionspr^ 

30 tiv markiertem Myc Protein inkubiert. Myc assoziiert spezifisch mit GST-Miz-1 , jedoch nicht mit GST. Eine Mutante von 
Myc, der die HLH Domane fehlt. konnte nicht mit GST-Miz-1 assoziieren. Radioaktiv markiertes Max interagiert weder 
mit GST-Miz-1 noch mit GST. Jedoch kann mit Hilfe von Myc Max an GST-Miz-1 -Kugelchen in vitro binden, was dafur 
spricht, daB Miz-1 und Max mit unterschiedlichen Flachen der HLH-Domane von Myc interagieren. 
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SEQUENZ PROTOKOLL 

(1) ALGEMEINE INFORMATION: 

(i) ANMELDER: 

(A) NAME: BASF Aktiengesellschaf t 

(B) STRASSE: Carl-Bosch-Strasse 38 

(C) ORT: Ludwigshafen 

(E) LAND: Bundesrepublik Deutschland 

(F) POSTLEITZAHL: D-67056 

(G) TELEPHON: 0621/6048526 

(H) TELEFAX: 0621/6043123 

(I) TELEX: 1762175170 

(ii) ANMELDETITEL: Myc-bindende Zinkf ingerproteine 
(iii) ANZAHL DER SEQUENZEN: 2 

(iv) COMPUTER- LE SB ARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patent In Release #1.0, version #1.25 (EPA) 

(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARACTERISTIC: 

(A) L&NGE: 2680 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANG FORMr—Etoz el _ 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKflLS: CDNS zu mRNS 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1..159 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 160. .2571 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 2572.. 2680 

(xi) SEQUENZBESCHRE IBUNG : SEQ ID NO: 1: 
GGAGTGCCGT CCCCGGCCTT CTCGCGGCCG TGATGCACCT CCCTCTGCGG TGGGGTCCGG 
GACATGGCAG GTAATGAGCC GGACGAGGGG AGCCAAGCTG GAGTTTACAC AGGCAAACTG 
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TCAGAAAAGA GTAGCCTGGG CTGTCTGGAA ATCTGAGCC ATG GAC TTT CCC CAG 

Met Asp Phe Pro Gin 
1 5 

CAC AGC CAG CAT GTC TTG GAA CAG CTG AAC CAG CAG CGG CAG CTG GGG 
His Ser Gin His Val Leu Glu Gin Leu Asn Gin Gin Arg Gin Leu Gly 
10 15 20 

CTT CTC TGT GAC TGC ACC TTT GTG GTG GAC GGT GTT CAC TTT AAG GCT 
Leu Leu Cys Asp Cys Thr Phe Val Val Asp Gly Val His Phe Lys Ala 
25 30 35 

CAT AAA GCA GTG CTG GCG GCC TGC AGC GAG TAC TTC AAG ATG CTC TTC 
His Lys Ala Val Leu Ala Ala Cys Ser Glu Tyr Phe Lys Met Leu Phe 
40 45 50 

GTG GAC CAG AAG GAC GTG GTG CAC CTG GAC ATC AGT AAC GCG GCA GGC 
Val Asp Gin Lys Asp Val Val His Leu Asp lie Ser Asn Ala Ala Gly 
55 60 65 

CTG GGG CAG ATG CTG GAG TTT ATG TAC ACG GCC AAG CTG AGC CTG AGC 
Leu Gly Gin Met Leu Glu Phe Met Tyr Thr Ala Lys Leu Ser Leu Ser 
70 75 80 85 

CCT GAG AAC GTG GAT GAT GTG CTG GCC GTG GCC ACT TTC CTC CAA ATG 
Pro Glu Asn Val Asp Asp Val Leu Ala Val Ala Thr Phe Leu Gin Met 
90 95 100 



CAG GAC ATC ATC ACG GCC TGC CAT GCC CTC AAG TCA~~ CTT^GCT^GAG-CGG 
Gin Asp He He Thr Ala Cys His Ala Leu Lys Ser Leu Ala Glu Pro 
105 HO 115 

GCT ACC AGC CCT GGG GGA AAT GCG GAG GCC TTG GCC ACA GAA GGA GGG 
Ala Thr Ser Pro Gly Gly Asn Ala Glu Ala Leu. Ala Thr Glu Gly Gly 
120 125 130 

GAC AAG AGA GCC AAA GAG. GAG AAG GTG GCC ACC AGC ACG CTG AGC AGG 
Asp Lys Arg Ala Lys Glu Glu Lys val Ala Thr Ser Thr Leu Ser Arg 
135 140 145 

CTG GAG CAG GCA GGA CGC AGC ACA CCC ATA GGC CCC AGC AGG GAC CTC 
Leu Glu Gin Ala Gly Arg Ser Thr Pro He Gly Pro Ser Arg Asp Leu 
150 155 160 165 

AAG GAG GAG CGC GGC GGT CAG GCC CAG AGT GCG GCC AGC GGT GCA GAG 
Lys Glu Glu Arg Gly Gly Gin Ala Gin Ser Ala Ala Ser Gly Ala Glu 
170 175 180 

CAG ACA GAG AAA GCC GAT GCG CCC CGG GAG CCG CCG CCT GTG GAG CTC 
Gin Thr Glu Lys Ala Asp Ala Pro Arg Glu Pro Pro Pro Val Glu Leu 
185 190 195 
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AAG CCA GAC CCC ACG ACT GGC ATG GCT GCC GCA GAA GCT GAG GCC GCT 798 
Lys Pro Asp Pro Thr Ser Gly Met Ala Ala Ala Glu Ala Glu Ala Ala 
200 205 210 

5 

TTG TCC GAG AGC TCG GAG CAA GAA ATG GAG GTG GAG CCC GCC CGG AAA 846 
Leu Ser Glu Ser Ser Glu Gin Glu Met Glu Val Glu Pro Ala Arg Lys 
215 220 225 

10 GGG GAA GAG GAG CAA AAG GAG CAA GAG GAG CAA GAG GAG GAG GGC GCA 894 

Gly Glu Glu Glu Gin Lys Glu Gin Glu Glu Gin Glu Glu Glu Gly Ala 
230 235 240 245 

GGG CCA GCT GAG GTC AAG GAG GAG GGT TCC CAG CTG GAG AAC GGA GAG 942 
15 Gly Pro Ala Glu Val Lys Glu Glu Gly Ser Gin Leu Glu Asn Gly Glu 

250 255 260 

GCC CCC GAG GAG AAC GAG AAT GAG GAG TCA GCG GGC ACA GAC TCG GGG 990 
Ala Pro Glu Glu Asn Glu Asn Glu Glu Ser Ala Gly Thr Asp Ser Gly 
265 270 275 

CAG GAG CTC GGC TCC GAG GCC CGG GGC CTG CGC TCA GGC ACC TAC GGC 1038 
Gin Glu Leu Gly Ser Glu Ala Arg Gly Leu Arg Ser Gly Thr Tyr Gly 
280 285 290 

GAC CGC ACG GAG TCC AAG GCC TAC GGC TCC GTC ATC CAC AAG TGC GAG 1086 
Asp Arg Thr Glu Ser Lys Ala Tyr Gly Ser Val lie His Lys Cys Glu 
295 300 305 



20 



25 



30 



35 



40 



GAC TGT GGG AAG GAG TTC ACG CAC ACG GGG AAC TTC AAG CGG CAC ATC ir3 " 4 ~ 
Asp Cys Gly Lys Glu Phe Thr His Thr Gly Asn Phe Lys Arg His He 
310 * 315 320 325 

CGC ATC CAC ACG GGG GAG AAG CCC TTC TCG TGC CGG GAG TGC AGC AAG 1182 
Arg He His Thr Gly Glu Lys Pro Phe Ser Cys Arg Glu Cys Ser Lys 
330 335 340 

GCC TTT TCC GAC CCG GCC GCG TGC AAG GCC CAT GAG AAG ACG CAC AGC 1230 
Ala Phe Ser Asp Pro Ala Ala Cys Lys Ala His Glu Lys Thr His Ser 
345 350 355 

CCT CTG AAG CCC TAC GGC TGC GAG GAG TGC GGG AAG AGC TAC CGC CTC 1278 
Pro Leu Lys Pro Tyr Gly Cys Glu Glu Cys Gly Lys Ser Tyr Arg Leu 
360. 365 370 

45 ATC A GC CTG CTG AAC CTG CAC AAG AAG CGG CAC TCG GGC GAG GCG CGC 1326 

He Ser Leu Leu Asn Leu His Lys Lys Arg His Ser Gly Glu Ala Arg 
375 380 385 

TAC CGC TGC GAG GAC TGC GGC AAG CTC TTC ACC ACC TCG GGC AAC CTC 1374 
50 Tyr Arg Cys Glu Asp Cys Gly Lys Leu Phe Thr Thr Ser Gly Asn Leu 

390 395 400 405 
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15 



20 



25 



30 



40 



50 



55 



AAG CGC CAC CAG CTG GTG CAC AGC GGC GAG AAG CCC TAC CAG TGC GAC 1422 
Lys Arg His Gin Leu Val His Ser Gly Glu Lys Pro Tyr Gin Cys Asp 
410 415 420 

TAC TGC GGC CGC TCC TTC TCC GAC CCC ACT TCC AAG ATG CGC CAC CTG 1470 
Tyr Cys Gly Arg Ser Phe Ser Asp Pro Thr Ser Lys Met Arg His Leu 
425 430 435 

GAG ACC CAC GAC ACG GAC AAG GAG CAC AAG TGC CCA CAC TGC GAC AAG 1518 
Glu Thr His Asp Thr Asp Lys Glu His Lys Cys Pro His Cys Asp Lys 
440 445 450 

AAG TTC AAC CAG GTA GGG AAC CTG AAG GCC CAC CTG AAG ATC CAC ATC 1566 
Lys Phe Asn Gin Val Gly Asn Leu Lys Ala His Leu Lys lie His He 
455 460 465 

GCT GAC GGG CCC CTC AAG TGC CGA GAG TGT GGG AAG CAG TTC ACC ACC 1614 
Ala Asp Gly Pro Leu Lys Cys Arg Glu Cys Gly Lys Gin Phe Thr Thr 
470 475 480 485 

TCA GGG AAC CTG AAG CGG CAA CTT CGG ATC CAC AGC GGG GAG AAG CCC 1662 
Ser Gly Asn Leu Lys Arg Gin Leu Arg lie His Ser Gly Glu Lys Pro 
490 495 500 

TAC GTG TGC ATC CAC TGC CAG CGA CAG TTT GCA GAC CCC GGC GCT CTG 1710 
Tyr Val Cys He His Cys Gin Arg Gin Phe Ala Asp Pro Gly Ala Leu 
505 510 515 



CAG CGG CAC GTC CGC ATT CAC ACA GGT GAG AAG CCA TGC CAG TGT GTG 1758 
Gin Arg His Val Arg He His Thr Gly Glu Lys Pro Cys Gin Cys Val 
520 525 530 

ATG TGC GGT AAG GCC TTC ACC CAG GCC AGC TCC CTC ATC GCC CAC GTG 1806 
Met Cys Gly Lys Ala Phe Thr Gin Ala Ser Ser Leu He Ala His Val 
535 540 545 

CGC CAG CAC ACC GGG GAG AAG CCC TAC GTC TGC GAG CGC TGC GGC AAG 1854 
Arg Gin His Thr Gly Glu Lys Pro Tyr Val Cys Glu Arg Cys Gly Lys 
550 555 560 565 

AGA TTC GTC CAG TCC AGC CAG TTG GCC AAT CAT ATT CGC CAC CAC GAC 1902 
Arg Phe Val Gin Ser Ser Gin Leu Ala Asn His He Arg His His Asp 
570 575 580 

45 AAC ATC CGC CCA CAC AAG TGC AGC GTG TGC AGC AAG GCC TTC GTG AAC 1950 

Asn He Arg Pro His Lys Cys Ser Val Cys Ser Lys Ala Phe Val Asn 
585 590 595 



GTG GGG GAC CTG TCC AAG CAC ATC ATC ATT CAC ACT GGA GAG AAG CCT 1998 
Val Gly Asp Leu Ser Lys His He He He His Thr Gly Glu Lys Pro 
600 605 610 
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TAC CTG TGT GAT AAG TGT GGG CGT GGC TTC AAC CGG GTA GAC AAC CTG 
Tyr Leu Cys Asp Lys Cys Gly Arg Gly Phe Asn Arg Val Asp Asn Leu 
615 620 625 

CGC TCC CAC GTG AAG ACC GTG CAC CAG GGC AAG GCA GGG ATC AAG ATC 
Arg Ser His Val Lys Thr Val His Gin Gly Lys Ala Gly He Lys He 
630 635 640 645 

CTG GAG CCC GAG GAG GGC AGT GAG GTC AGC GTG GTC ACT GTG GAT GAC 
Leu Glu Pro Glu Glu Gly Ser Glu Val Ser Val Val Thr Val Asp Asp 
650 655 660 

ATG GTC ACG CTG GCT ACC GAG GCA CTG GCA GCG ACA GCC GTC ACT CAG 
Met Val Thr Leu Ala Thr Glu Ala Leu Ala Ala Thr Ala Val Thr Gin 
665 670 675 

CTC ACA GTG GTG CCG GTG GGA GCT GCA GTG ACA GCC GAT GAG ACG GAA 
Leu Thr Val Val Pro Val Gly Ala Ala Val Thr Ala Asp Glu Thr Glu 
680 685 690 

GTC CTG AAG GCC GAG ATC AGC AAA GCT GTG AAG CAA GTG CAG GAA GAA 
Val Leu Lys Ala Glu He Ser Lys Ala Val Lys Gin val Gin Glu Glu 
695 700 705 

GAC CCC AAC ACT CAC ATC CTC TAC GCC TGT GAC TCC TGT GGG GAC AAG 
Asp Pro Asn Thr His lie Leu Tyr Ala Cys Asp Ser Cys Gly Asp Lys 
710 715 720 725 



Phe Leu Asp Ala Asn Ser Leu Ala Gin His Val Arg He His Thr Ala 
730 735 740 

CAG GCA CTG GTC ATG TTC CAG ACA GAC GCG GAC TTC TAT CAG CAG TAT 
Gin Ala Leu Val Met Phe Gin Thr Asp Ala Asp Phe Tyr Gin Gin Tyr 
745 750 755 

GGG CCA GGT GGC ACG TGG CCT GCC GGG CAG GTG CTG CAG GCT GGG GAG 
Gly Pro Gly Gly Thr Trp Pro Ala Gly Gin Val Leu Gin Ala Gly Glu 
760 765 770 

CTG GTC TTC CGC CCT CGC GAC GGG GCT GAG GGC CAG CCC GCA CTG GCA 
Leu val Phe Arg Pro Arg Asp Gly Ala Glu Gly Gin Pro Ala Leu Ala 
775 780 785 

GAG ACC TCC CCT ACA CCT CCT GAA TGT CCC CCG CCT GCC GAG TGAGCTGGCG 
Glu Thr Ser Pro Thr Pro Pro Glu Cys Pro Pro Pro Ala Glu 
790 795 800 

GCCCTTCTGA CTGTTTATTT AAGGATGGAT GGCACCCTGG AACCGGGAAG GGTGGCCTGT 
TCCCTAGAGA GAATAAATTG GATTATTTTC TAAAAAAAAA AA 
(2) INFORMATION ZU SEQ ID NO: 2: 



2046 



2094 



2142 



2190 



2238 



2286 



2334 



TTT CTG GAT GCC AAC AGC CTG GCT CAG CAT GTG CGA ATC~CAC-ACA-G€C 23^2- 



2430 

2478 

2526 

2578 

2638 
2680 
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(i) SEQUENZ CHARAKTERI ST IKA : 

(A) LANGE: 803 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

{ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Met Asp Phe Pro Gin His Ser Gin His Val Leu Glu Gin Leu Asn Gin 
1 5 10 15 

Gin Arg Gin Leu Gly Leu Leu Cys Asp Cys Thr Phe Val Val Asp Gly 
20 25 30 

Val His Phe Lys Ala His Lys Ala Val Leu Ala Ala Cys Ser Glu Tyr 
35 40 45 

Phe Lys Met Leu Phe Val Asp Gin Lys Asp Val Val. His Leu Asp lie 
20 50 55 60 

Ser Asn Ala Ala Gly Leu Gly Gin Met Leu Glu Phe Met Tyr Thr Ala 
65 70 75 80 

25 Lys Leu Ser Leu Ser Pro Glu Asn Val Asp Asp Val Leu Ala Val Ala 

85 90 95 

Thr Phe Leu Gin Met Gin Asp lie He Thr Ala Cys His Ala Leu Lys 

i00 1-05 110 
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Ser Leu Ala Glu Pro Ala Thr Ser Pro Gly Gly Asn Ala Glu Ala Leu 
115 120 125 

Ala Thr Glu Gly Gly Asp Lys Arg Ala Lys Glu Glu Lys Val Ala Thr 
130 135 140 

35 

Ser Thr Leu Ser Arg Leu Glu Gin Ala Gly Arg Ser Thr Pro He Gly 

145 150 155 160 

Pro Ser Arg Asp Leu Lys Glu Glu Arg Gly Gly Gin Ala Gin Ser Ala 
40 165 170 175 

Ala Ser Gly Ala Glu Gin Thr Glu Lys Ala Asp Ala Pro Arg Glu Pro 
180 185 190 



Pro Pro Val Glu Leu Lys Pro Asp Pro Thr Ser Gly Met Ala Ala Ala 
195 200 205 

Glu Ala Glu Ala Ala Leu Ser Glu Ser Ser Glu Gin Glu Met Glu Val 
210 215 220 

Glu Pro Ala Arg Lys Gly Glu Glu Glu Gin Lys Glu Gin Glu Glu Gin 
225 230 235 240 



10 



EP 0 875 567 A2 



Glu Glu Glu Gly Ala Gly Pro Ala Glu Val Lys Glu Glu Gly Ser Gin 
245 250 255 

Leu Glu Asn Gly Glu Ala Pro Glu Glu Asn Glu Asn Glu Glu Ser Ala 
260 265 270 

Gly Thr Asp Ser Gly Gin Glu Leu Gly . Ser Glu Ala Arg Gly Leu Arg 
275 280 285 

Ser Gly Thr Tyr Gly Asp Arg Thr Glu Ser Lys Ala Tyr Gly Ser Val 
290 295 300 

lie His Lys Cys Glu Asp Cys Gly Lys Glu Phe Thr His Thr Gly Asn 
305 310 315 320 

Phe Lys Arg His He Arg He His Thr Gly Glu Lys Pro Phe Ser Cys 
325 330 335 

Arg Glu Cys Ser Lys Ala Phe Ser Asp Pro Ala Ala Cys Lys Ala His 
340 345 350 

Glu Lys Thr His Ser Pro Leu Lys Pro Tyr Gly Cys Glu Glu Cys Gly 
355 360 365 

Lys Ser Tyr Arg Leu He Ser Leu Leu Asn Leu His Lys Lys Arg His 
370 375 380 

se^r-Giy-aiu^a^g_Tyr_Axg_Cys Glu Asp Cys Gly Lys Leu Phe Thr 
385 390 395 «0~ 

Thr Ser Gly Asn Leu Lys Arg His Gin Leu Val His Ser Gly Glu Lys 
405 410 415 

Pro Tyr Gin Cys Asp Tyr Cys Gly Arg Ser Phe Ser Asp Pro Thr Ser 
420 425 430 

Lys Met Arg His Leu Glu Thr His Asp Thr Asp Lys Glu His Lys Cys 
435 440 445 

Pro His Cys Asp Lys Lys Phe Asn Gin Val Gly Asn Leu Lys Ala His 
450 455 460 

Leu Lys He His He Ala Asp Gly Pro Leu Lys Cys Arg Glu Cys Gly 
465 470 475 480 

Lys Gin Phe Thr Thr Ser Gly Asn Leu Lys Arg Gin Leu Arg He His 
485 490 495 

Ser Gly Glu Lys Pro Tyr Val Cys He His Cys Gin Arg Gin Phe Ala 
500 505 510 

Asp Pro Gly Ala Leu Gin Arg His Val Arg He His Thr Gly Glu Lys 
515 520 525 
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Pro Cys Gin Cys Val Met Cys Gly Lys Ala Phe Thr Gin Ala Ser Ser 
530 535 540 

Leu He Ala His Val Arg Gin His Thr Gly Glu Lys Pro Tyr Val Cys 
545 550 555 560 

Glu Arg Cys Gly Lys Arg Phe Val Gin Ser Ser Gin Leu Ala Asn His 
565 570 575 

lie Arg His His Asp Asn He Arg Pro His Lys Cys Ser Val Cys Ser 
580 585 590 

Lys Ala Phe Val Asn Val Gly Asp Leu Ser Lys His He He He His 
595 600 605 

Thr Gly Glu Lys Pro Tyr Leu Cys Asp Lys Cys Gly Arg Gly Phe Asn 
610 615 620 

Arg Val Asp Asn Leu Arg Ser His Val Lys Thr Val His Gin Gly Lys 
625 630 635 640 

Ala Gly He Lys He Leu Glu Pro Glu Glu Gly Ser Glu Val Ser Val 
645 650 655 

Val Thr Val Asp Asp Met Val Thr Leu Ala Thr Glu Ala Leu Ala Ala 
660 665 670 



Thr A ia Val Thr Gin Leu Thr va l~VaT-Pr o-Val-G-ly-Al a-JUa_Val_Thr 
675 680 685 



Ala Asp Glu Thr Glu Val Leu Lys Ala Glu He Ser Lys Ala Val Lys 
690 695 700 

Gin Val Gin Glu Glu Asp Pro Asn Thr His He Leu Tyr Ala Cys Asp 
705 710 715 720 

Ser Cys Gly Asp Lys Phe Leu Asp Ala Asn Ser Leu Ala Gin His Val 
725 730 735 



Arg 



He His Thr Ala Gin Ala Leu Val Met Phe Gin Thr Asp Ala Asp 



740 



745 



750 



Phe Tyr Gin Gin Tyr Gly Pro Gly Gly Thr Trp Pro Ala Gly Gin Val 
755 760 765 

Leu Gin Ala Gly Glu Leu Val Phe Arg Pro Arg Asp Gly Ala Glu Gly 
77 0 775 780 

Gin Pro Ala Leu Ala Glu Thr Ser Pro Thr Pro Pro Glu Cys Pro Pro 
785 790 795 800 

Pro Ala Glu 
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Patentanspruche 

1 . Isoliertes Protein mit der in SEQ ID NO:2 dargestellten Aminosauresequenz sowie die daraus durch Substitution, 
Insertion oder Deletion von einem oder mehreren Aminosaureresten erhaWichen Muteine, die noch die wesentli- 
chen biologischen Eigenschaften des in SEQ ID NO:2 dargestelrt n Proteins besitzen. 

2. Protein gemaB Anspruch 1 , dadurch gekennzeichnet, daB es sich um ein humanes Protein handelt. 

3. Nukleinsauresequenz codierend IQr ein Protein gemaB Anspruch 1 . 

4. Nukleinsauresequenz nach Anspruch 3, dadurch gekennzeichnet, daB sie fur ein Protein codiert, das mindestens 
95 % Identitat mit der in SEQ ID NO:2 dargestellten Sequenz besitzt 

5. Nukleinsauresequenz nach Anspruch 3, dadurch gekennzeichnet, daB sie die in SEQ ID NO:1 dargestellte Struktur 
besitzt. 

6. Vektor enthaltend eine Nukleinsauresequenz gemaB Anspruch 3 - 5, funktionell verknupft mit mindestens einem 
Regulationselement. 

7. Wirtsorganismus, transformiert mit einer Nukleinsauresequenz nach Anspruch 3. 

8. Wirtsorganismus, transformiert mit einem Vektor gemaB Anspruch 6. 

9. Verfahren zur Herstellung eines Proteins gemaB Anspruch 1 , dadurch gekennzeichnet, daB man einen Wirtsorga- 
nismus gemaB Anspruch 6 unter Bedingungen kultiviert, die die Expression des Proteins erlauben und anschlie- 
Bend das exprimierte Protein vom Wirtsorganismus abtrennt una in reiner Form isoliert. 

jl.(L_ Verwendung eines Proteins gemaB A nspruch 1 zur Identif izierung von spezifischen transkriptionsmodulierenden 
Substanzen. " " " - 

11. Verfahren zur Identif izierung von spezifischen transkriptionsmodulierenden Substanzen, das folgende Schritte 
umfaBt: 

(a) Inkubation des Proteins gemaB Anspruch 1 mit dem Genprodukt von myc unter Bedingungen, unter denen 
sich ein Proteinkomplex zwischen diesen beiden Proteinen ausbildet, 

(b) Inkubation der beiden Proteine unter ansonst gleichen Bedingungen wie (a) jedoch in Anwesenheit einer 
oder mehrerer Substanzen, die auf spezifische transkriptionsmodulierende Aktivitaten zu testen sind, 

(c) Erm'rtteln des Unterschiedes in der Proteinkomplexbildung zwischen (b) und (a). 

(d) Auswahl solcher Substanzen, bei denen gemaB Schritt (b) eine andere Proteinkomplexbildung erhalten 
wurde als bei Schritt (a). 

12. Verwendung eines Proteins gemaB Anspruch 1 als Antigen zur Herstellung von spezifischen AntikOrpern. 

13. Verwendung einer Nukleinsauresequenz nach Anspruch 3 zur Gentherapie. 

14. Verwendung einer zu der Sequenz gemaB Anspruch 3 komplementaren Nukleinsauresequenz zur Gentherapie. 

15. Verwendung nach Anspruch 13 oder 14. dadurch gekennzeichnet, daB man durch die exogen zugefuhrte Nuklein- 
sauresequenz die zelluiare Konzentration des Proteins gemaB Anspruch 1 erh6ht oder erniedrigt 
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